文章目录
通常在层次聚类分析中,我们的数据处理结果会出现龙骨图或者叫做分类谱系图,其实在很多论文中,我们不需要报告龙骨图,所以大部分spss课本中并没有对龙骨图进行详细的介绍,在这,我给大家分享一篇经验,讲一下如何分析龙骨图(聚类谱系图)。
- 两种样式的龙骨图,如图所示:下面第一幅图是spss20.0的样式,而在低版本中,spss出现的龙骨图是下面第二幅图的样式,不管哪种样式,分析的方法都是一样的。
- 龙骨图的本质是让我们看到聚类的过程:为了清晰可见,我们使用spss20.0产生的龙骨图,最左侧一列数字代表不同的省份,对省份进行分类,第一次分类结果是从各个数字延伸出来的直线相交点,如图所示,红色方框就是第一次聚类产生的类别。
- 同样的方式,我们看第二次聚类的结果为,假如我问你,第一个类别包含哪些省份?你应该能够说出来,应当是山西、江西、内蒙、吉林、安徽。
- 横断法观察分类个数:通常我们使用一条线截断分类线来获得分类结果,如图所示。画一条竖直的直线,与分类线相交,我们看到出现了5个交点,所以应该是分成五类,而我们看最上面一条刻度线,红线与刻度线相交的点就是类间距离。分成五类的类间距离就是8。
- 类间距离的计算方法有很多种,通常使用的是组间平均距离法师最稳健的方法,所以通常我们说类间距离的时候说的都是组间平均距离,它指的是各组数据点两两之间的距离的平均。
转载请注明来自DataScience.
邮箱: 675495787@qq.com